Aggregation Functions (SUM, AVG, COUNT, etc.)

Big Data and Analytics - অ্যাপাচি ইমপালা (Apache Impala) - Impala এর জন্য Data Aggregation এবং Window Functions
187

Apache Impala তে Aggregation Functions ব্যবহার করা হয় ডেটার ওপর বিভিন্ন গণনা বা সারাংশ তৈরি করতে। এই ফাংশনগুলো ডেটাসেটের একটি বা একাধিক কলামের ওপর কাজ করে এবং সাধারণত একটি আউটপুট রিটার্ন করে, যা সাধারণত সংখ্যাসূচক মান হয়। Aggregation Functions মূলত ডেটা বিশ্লেষণের জন্য ব্যবহৃত হয়, যেমন মোট যোগফল, গড়, গণনা ইত্যাদি।

এখানে Impala তে ব্যবহৃত কিছু গুরুত্বপূর্ণ Aggregation Functions আলোচনা করা হলো।


১. SUM()

SUM() ফাংশনটি একটি নির্দিষ্ট কলামের সব মানের যোগফল বের করে। এটি সাধারণত সংখ্যাসূচক ডেটার জন্য ব্যবহৃত হয়।

উদাহরণ:

SELECT SUM(sales_amount) AS total_sales
FROM sales;

এটি sales টেবিলের sales_amount কলামের সব মান যোগফল করবে এবং total_sales নামক আউটপুট রিটার্ন করবে।


২. AVG()

AVG() ফাংশনটি একটি নির্দিষ্ট কলামের গড় মান বের করে। এটি সাধারণত সংখ্যাসূচক ডেটা যেমন বয়স, মূল্য, পরিমাণ ইত্যাদি গণনা করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT AVG(age) AS average_age
FROM employees;

এটি employees টেবিলের age কলামের গড় বয়স বের করবে এবং average_age আউটপুট রিটার্ন করবে।


৩. COUNT()

COUNT() ফাংশনটি একটি কলামের (বা সব রেকর্ডের) সংখ্যার হিসাব করে। এটি সাধারণত ডেটাসেটে কয়টি রেকর্ড বা নির্দিষ্ট মান আছে তা জানার জন্য ব্যবহৃত হয়।

উদাহরণ:

SELECT COUNT(*) AS total_employees
FROM employees;

এটি employees টেবিলের মোট রেকর্ড বা কর্মচারীর সংখ্যা বের করবে।

একটি নির্দিষ্ট কলামের মান গোনা:

SELECT COUNT(department_id) AS department_count
FROM employees;

এটি department_id কলামের মোট রেকর্ডের সংখ্যা বের করবে।


৪. MIN()

MIN() ফাংশনটি একটি কলামের সর্বনিম্ন মান বের করে। এটি সাধারণত সর্বনিম্ন মূল্য, পরিমাণ বা অন্য যে কোনো সংখ্যাসূচক মান বের করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT MIN(salary) AS lowest_salary
FROM employees;

এটি employees টেবিলের salary কলামের সর্বনিম্ন বেতন বের করবে এবং lowest_salary আউটপুট হিসেবে দেখাবে।


৫. MAX()

MAX() ফাংশনটি একটি কলামের সর্বোচ্চ মান বের করে। এটি সাধারণত সর্বোচ্চ মূল্য, পরিমাণ বা অন্য কোনো সংখ্যাসূচক মান বের করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT MAX(salary) AS highest_salary
FROM employees;

এটি employees টেবিলের salary কলামের সর্বোচ্চ বেতন বের করবে এবং highest_salary আউটপুট হিসেবে দেখাবে।


৬. GROUP_CONCAT()

GROUP_CONCAT() ফাংশনটি একটি কলামের মানগুলোকে একত্রিত করে একটি স্ট্রিং আকারে রিটার্ন করে। এটি বিশেষভাবে ব্যবহার করা হয় যখন একাধিক মান একত্রে দেখানোর প্রয়োজন হয়।

উদাহরণ:

SELECT department_id, GROUP_CONCAT(employee_name) AS employee_names
FROM employees
GROUP BY department_id;

এটি employees টেবিলের employee_name গুলোর একটি স্ট্রিং তৈরি করবে, যা department_id এর ভিত্তিতে গ্রুপ করা হবে।


৭. STDDEV()

STDDEV() ফাংশনটি একটি কলামের স্ট্যান্ডার্ড ডেভিয়েশন বের করে, যা ডেটার বৈচিত্র্য বা ছড়িয়ে পড়া পরিমাপ করে।

উদাহরণ:

SELECT STDDEV(salary) AS salary_deviation
FROM employees;

এটি employees টেবিলের salary কলামের স্ট্যান্ডার্ড ডেভিয়েশন বের করবে।


৮. VARIANCE()

VARIANCE() ফাংশনটি একটি কলামের ভ্যারিয়েন্স বের করে, যা ডেটার ছড়িয়ে পড়া বা বৈচিত্র্য পরিমাপ করে। এটি স্ট্যান্ডার্ড ডেভিয়েশনের বর্গফল।

উদাহরণ:

SELECT VARIANCE(salary) AS salary_variance
FROM employees;

এটি employees টেবিলের salary কলামের ভ্যারিয়েন্স বের করবে।


৯. COUNT(DISTINCT)

COUNT(DISTINCT) ফাংশনটি একটি কলামের ইউনিক বা আলাদা মানের সংখ্যা বের করে। এটি ডুপ্লিকেট মান বাদ দিয়ে আলাদা মান গণনা করতে ব্যবহৃত হয়।

উদাহরণ:

SELECT COUNT(DISTINCT department_id) AS unique_departments
FROM employees;

এটি employees টেবিলের department_id কলামের ইউনিক বা আলাদা department_id গুলি গণনা করবে।


সারাংশ

Impala তে Aggregation Functions বিভিন্ন ধরনের পরিসংখ্যান বের করতে ব্যবহৃত হয়, যেমন মোট যোগফল (SUM), গড় (AVG), মোট গণনা (COUNT), সর্বনিম্ন মান (MIN), সর্বোচ্চ মান (MAX), এবং আরও অনেক কিছু। এই ফাংশনগুলো ডেটা বিশ্লেষণে অত্যন্ত গুরুত্বপূর্ণ এবং ডেটাবেসের বিভিন্ন কলামের ওপর সারাংশ বা সামগ্রিক পরিসংখ্যান তৈরি করতে সহায়ক। GROUP BY ক্লজ ব্যবহার করে বিভিন্ন গ্রুপে ডেটা বিভক্ত করে এই ফাংশনগুলো প্রয়োগ করা যায়, যা আরও গভীর বিশ্লেষণ করতে সাহায্য করে।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...